دودویی سازی مستندات چاپی و اسکن شده به زبان فارسی بر اساس استخراج ویژگی
پایان نامه
- دانشگاه تربیت معلم - تهران - دانشکده فنی
- نویسنده فاطمه فاضلی
- استاد راهنما جمشید شنبه زاده عبدالحسین صراف زاده
- سال انتشار 1392
چکیده
هدف از این پایان نامه معرفی روشی برای دودویی سازی مستندات چاپی و اسکن شده به زبان فارسی بر اساس ویژگی های آن ها می باشد. این فرآیند باعث کاهش چشمگیر حجم اسناد می شود و یکی از مهمترین مراحل فرآیند پیش پردازش و بهبود کیفیت تصاویر است. فرآیند دودویی سازی بطور کلی نوعی کلاس بندی پیکسل های تصویر بر اساس ویژگی های آن ها می باشد. ورودی این فرآیند برداری از ویژگی های تصویر می باشد که با استخراج مهمترین ویژگی ها و ایجاد تابع ارزیابی بر اساس آن ها، مقدار حد آستانه مناسب جهت کلاس بندی پیکسل ها محاسبه می شود. ویژگی های استخراجی می توانند ویژگی های کلیِ تصویر و یا ویژگی های محلی و یا ترکیبی از هر دو نوع باشند. این پایان نامه سعی دارد تا با استخراج ویژگی های مناسب به دودویی سازی اسناد بپردازد. الگوریتم پیشنهادی ابتدا بر اساس ویژگی های کلی تصویر، آن را بلاک بندی می کند و سپس با استخراج ویژگی های مناسب از هر بلاک به جداسازی بلاک های متنی از بلاک های غیر متنی می پردازد و در پایان بلاک های متنی را بطور جداگانه دودویی می کند. ارزیابی الگوریتم پیشنهادی در سه مرحله انجام گرفته است. مرحله اول ارزیابی عملیات جداسازی بلاک های متنی و غیر متنی می باشد، مرحله دوم ارزیابی شهودی و محاسباتی فرآیند دودویی سازی است و مرحله سوم بررسی پیچیدگی اجرایی الگوریتم پیشنهادی می باشد. براساس نتایج بدست آمده، پاسخِ الگوریتم پیشنهادی به علت استخراج ویژگی های مناسب و استفاده همزمان از خصوصیات کلی و محلی تصویر، در شرایط مختلف همچون نویز و توازن نورِ متغیر، مطلوب می باشد.
منابع مشابه
مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure
کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...
متن کاملرفع نویز و دودویی سازی تصاویر اسناد چاپی به کمک خوشه بندی ویژگی ها
در این پایان نامه، یک روش جدید جهت رفع نویز و دودویی سازی تصویر اسکن شده اسناد با جامعیتی بالاتر از روش های موجود ارائه شده است. رفع نویز یکی از بخش های مهم در مرحله پیش پردازش سیستم های بازشناسی حروف با کمک ابزار نوری ( ocr) است. تصاویر اسناد، ممکن است در مرحله تولید (چاپ یا نوشتن)، اسکن شدن یا آرشیو شدن پیش از اینکه هرنوع پردازش هوشمندی روی آن ها انجام گیرد، دچار نویز شوند. از آنجایی که وجود ...
استخراج ویژگی ترکیبی مبتنی بر ژنتیک دودویی جهت بهبود عملکرد تشخیص در سیستمهای بازشناسی عنبیه
سامانه تشخیص عنبیه از چند مرحله تشکیلشده، که یکی از مهمترین مراحل آن استخراج ویژگی است. اکثر سامانههای موجود از یک روش خاص جهت استخراج ویژگی استفاده میکنند. در راستای ایجاد بهبودِ عملکردِ سامانه از الگوریتم ژنتیک دودویی با استفاده از یک معیار برازندگی جدید جهت یافتن روش استخراج ویژگی ترکیبی بهره گرفتیم. روش پیشنهادی از تعداد زیادی فیلتر و تبدیل که در استخراج ویژگی از عنبیه کاربرد فراوانی دارن...
متن کاملنقد واژگان ترجمه قرآن به زبان فارسی بر اساس بافت
وجود واژه هاى چند معنا و همنام در هر زبانى فهم متن را دچار مشکل مى کند. از آنجا که قرآن به زبان بشرى نازل شده وجود این نوع واژه ها در آن امرى اجتناب ناپذیر است. قرآن پژوهان در گذشته با عنوان وجوه و نظایر و مشترک لفظى به بررسى این نوع واژگان قرآنى پرداخته اند. در زبانشناسى جدید بافت زبانى و فرا زبانى براى تشخیص مفهوم واژه هاى هم معنى و چند معنى مورد توجه قرار گرفته است. در این مقاله ابتدا...
متن کاملتحلیل و اژه سازی زبان فارسی بر اساس نظریه صرف ساخت بنیاد: شواهدی از کلمات مرکب
مقاله حاضر سعی دارد دلایل و شواهدی مبنی بر تحلیل فرآیندهای واژه سازی در زبان فارسی بر اساس صرف ساخت بنیاد (Booij, 2010b) ارائه دهد .در ابتدا مفاهیم ساخت، واژگان سلسله مراتبی و الگوی واژهسازی معرفی خواهند شد. بر اساس این رویکرد به جای قواعد واژهسازی از الگوهای واژهسازی استفاده میشود. سپس نشان داده میشود که ویژگیهای کلی برخی کلمات مرکب از جمله کلمات مرکب برونمرکز، شاهدی برای تحلیل این نوع...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
دانشگاه تربیت معلم - تهران - دانشکده فنی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023